智能论文笔记

Top Two Algorithms Revisited

Marc Jourdan , Rémy Degenne , Dorian Baudry , Rianne de Heide , Emilie Kaufmann

分类： (统计)机器学习 | 机器学习

2022-06-13

出现了前两种算法，作为汤普森采样对多臂匪徒模型中最佳手臂识别的适应（Russo，2016），用于武器的参数家族。他们通过在两个候选臂，一个领导者和一个挑战者中随机化来选择下一个要采样的臂。尽管具有良好的经验表现，但仅当手臂是具有已知差异的高斯时，才能获得固定信心最佳手臂识别的理论保证。在本文中，我们提供了对两种方法的一般分析，该方法确定了领导者，挑战者和武器（可能是非参数）分布的理想特性。结果，我们获得了理论上支持的前两种算法，用于具有有限分布的最佳臂识别。我们的证明方法特别证明了用于选择从汤普森采样继承的领导者的采样步骤可以用其他选择代替，例如选择经验最佳的臂。

translated by 谷歌翻译

From Optimality to Robustness: Dirichlet Sampling Strategies in Stochastic Bandits

Dorian Baudry , Patrick Saux , Odalric-Ambrym Maillard

分类： (统计)机器学习 | 机器学习

2021-11-18

在臂分布的标准假设下广泛研究了随机多臂强盗问题（例如，用已知的支持，指数家庭等）。这些假设适用于许多现实世界问题，但有时他们需要知识（例如，在尾部上），从业者可能无法精确访问，提高强盗算法的鲁棒性的问题，以模拟拼盘。在本文中，我们研究了一种通用的Dirichlet采样（DS）算法，基于通过重新采样的武器观测和数据相关的探索奖励计算的经验指标的成对比较。我们表明，当该策略的界限和对数后悔具有轻度分量度条件的半界分布时，这种策略的不同变体达到了可证明的最佳遗憾。我们还表明，一项简单的调整在大类无界分布方面实现了坚固性，其成本比对数渐近的遗憾略差。我们终于提供了数字实验，展示了合成农业数据的决策问题中DS的优点。

translated by 谷歌翻译

Learning-based estimation of in-situ wind speed from underwater acoustics

Matteo Zambra , Dorian Cazau , Nicolas Farrugia , Alexandre Gensse , Sara Pensieri , Roberto Bozzano , Ronan Fablet

分类：机器学习

2022-08-18

海面的风速检索对于科学和操作应用至关重要。除了天气模型，原位测量和遥感技术，尤其是卫星传感器外，还提供了互补的手段来监视风速。随着海面风产生传播水下的声音，水下声学录音也可以传递与风向相关的信息。尽管模型驱动的方案，尤其是数据同化方法，是解决地球科学反向问题的最新方案，但机器学习技术变得越来越有吸引力，可以完全利用观察数据集的潜力。在这里，我们介绍了一种深度学习方法，用于从水下声学中检索风速序列，这可能是由其他数据源（例如天气模型重新分析）进行补充的。我们的方法桥接数据同化和基于学习的框架，以从先前的物理知识和计算效率中受益。实际数据上的数值实验表明，我们优于最先进的数据驱动方法，其相对增益就RMSE而言高达16％。有趣的是，这些结果支持水下声学数据的时间动力学的相关性，以更好地告知风速的时间演变。他们还表明，在这里，多模式数据（此处的水下声学数据与ECMWF重新分析数据相结合）可能会进一步改善重建性能，包括相对于缺少水下的声学声学数据的鲁棒性。

translated by 谷歌翻译

BodySLAM: Joint Camera Localisation, Mapping, and Human Motion Tracking

Dorian F. Henning , Tristan Laidlow , Stefan Leutenegger

分类：计算机视觉 | 机器人

2022-05-04

由于其许多潜在应用，从视频中估算人类运动是一个活跃的研究领域。大多数最先进的方法可以预测单个图像的人类形状和姿势估计，并且不利用视频中可用的时间信息。许多“野生”运动序列被移动的摄像机捕获，这为估计增加了混合的摄像头和人类运动的并发症。因此，我们介绍了Bodyslam，这是一种单眼大满贯系统，共同估计人体的位置，形状和姿势以及摄像机轨迹。我们还引入了一种新型的人类运动模型，以限制顺序身体姿势并观察场景的规模。通过通过移动的单眼相机捕获的人类运动的视频序列进行的一系列实验，我们证明了Bodyslam与单独估计这些估计相比，可以改善所有人体参数和相机的估计。

translated by 谷歌翻译

Self-Supervised Beat Tracking in Musical Signals with Polyphonic Contrastive Learning

Dorian Desblancs

分类：机器学习

2022-01-05

注释音乐节拍在繁琐的过程中是很长的。为了打击这个问题，我们为节拍跟踪和下拍估算提出了一种新的自我监督的学习借口任务。这项任务利用SPLEETER，一个音频源分离模型，将歌曲的鼓从其其余的信号分开。第一组信号用作阳性，并通过延长否定，用于对比学习预培训。另一方面，鼓的信号用作锚点。使用此借口任务进行全卷积和复发模型时，学习了一个开始功能。在某些情况下，发现此功能被映射到歌曲中的周期元素。我们发现，当一个节拍跟踪训练集非常小（少于10个示例）时，预先训练的模型随机初始化模型表现优于随机初始化的模型。当不是这种情况时，预先训练导致了一个学习速度，导致模型过度训练集。更一般地说，这项工作定义了音乐自我监督学习领域的新观点。尤其是使用音频源分离作为自我监督的基本分量的作品之一。

translated by 谷歌翻译

Constraint-based Diversification of JOP Gadgets

Rodothea Myrsini Tsoupidi , Roberto Castañeda Lozano , Benoit Baudry

分类：人工智能

2021-11-18

现代软件部署过程产生统一的软件，因此容易受到大规模的代码重用攻击，例如跳转编程（JOP）攻击。基于编译器的多样化通过自动生成给定程序的不同装配代码版本来提高软件系统的恢复。现有技术是有效的，但不具有对所产生变体的质量的精确控制。本文介绍了建筑（Divcon）的多样性，基于约束的软件多样化方法。与以前的方法不同，Divcon允许用户控制和调整多样性和代码质量的冲突目标。关键推动器是使用大型邻域搜索（LNS）以有效地生成高度多样化的代码。对于更大的问题，我们提出了LNS的组合，其结构分解了问题。为了进一步提高Divcon对JOP攻击的多样化效率，我们提出了一种针对JOP攻击特征的特定于应用的距离测量。我们评估嵌入式系统的流行基准套件20个功能。这些实验表明，LNS和我们的应用程序特定距离测量的组合产生了对JOP攻击具有高度弹性的二进制程序。我们的结果证实，每个汇编代码版本和整个版本池的多样性之间存在权衡。特别是，实验表明，Divcon生成近最佳的二进制程序，这些程序共享少量小工具。对于约束编程研究人员和从业者，本文表明LNS是寻找多样化解决方案的宝贵技术。对于安全研究人员和软件工程师，Divcon将基于编译的多样化范围扩展到性能关键和资源受限应用程序。

translated by 谷歌翻译